Практикум 12. Поиск по сходству. BLAST, E-value

Задание 1. Проверка гомоличности белков, найденных по сходству.

При выполнении данного задания был произведен поиск в BLAST по сходству с белком Lipase (Aneurinibacillus sp. XH2). С длиной слова - 6, по базе данных SwissProt. В таблице 1 представлена основная информация о 9 находках. Для определения гомологичности найденных белков были выделены блоки, которые представлены на Рис.1. Таблица 1. Основные характеристики белков - находок.

ID/AC Название белка Coverage Identity (%) E-value Гомологичность
Q5U780.3 Lipase; AltName: Lip 42 98 57 2e-134 да
Q5HCM7.1 Lipase 1; AltName: Glycerol ester hydrolase 1 98 42 4e-87 да
Q5HKP6.1 Lipase; AltName: Full=Glycerol ester hydrolase 98 42 1e-84 да
P0C0R4.1 Lipase; AltName: Full=Glycerol ester hydrolase 98 41 2e-83 да
P04635.1 Lipase; AltName: Full=Phospholipase A1 98 40 2e-79 да
Q8NYC2.1 Lipase 2; AltName: Full=Glycerol ester hydrolase 2 96 39 2e-78 да
P15493.2 Lipase; AltName: Full=Triacylglycerol lipase 71 24 2e-06 нет
P54857.1 Lipase 2; AltName: Full=Triacylglycerol lipase 2 42 26 0.005 нет
B5FHY5.1 D-tagatose-1,6-bisphosphate aldolase subunit GatZ 9 35 5.8 нет











Рис.1


Комментарии


На Рис.1 представлены блоки,по которым можно предположительно определить гомологичность тех или иных белков. Блоки выделены красным цветом. Данные блоки выбирались в связи с определенным набором характеристик: начало и конец должны быть абсолютно консервативны, внутри блока длины 10, должно быть 5 консервативных позиций,длины 5-4 позиции. В них не должно быть гэпов,также блок должен содержать достаточное количество как абсолютно консервативных, так и функционально консервативных позиций. По первым двум блокам, видно, что гомологичными между собой белками можно считать первые 7 белков. В третьем блоке, можно было бы добавить еще два (P15493.2,P54857.1). Однако, если учесть также E-value и Identity %, данные белки нельзя отнести к гомологичным. Значения E-value довольно высок, в сравнении с остальными. Более подробно с самим выравнизанием можете познакомится здесь.

Задание 2.

При выполнении данного задания были составлены карты гомологичных белков из предыдущего задания, однако никах особенных изменеий на них обнаружено не было. В связи с этим был осуществлен поиск различных доменов. Я остановилась на домене Lectin_legB. Просматривая различные архитектуры, я обнаружила, что он довольно часто встречается вместе с Pkinase доменом. Были выбраны 2 архитектуры, в которых я предположила наличие транслокации.
ID: M0TM94 и A0A087GZ82
Названия обоих белков: Uncharacterized protein
Длина слова - 2
Порог на e-value: 2e-06
Карта представлена на Рис.2 На карте Query_165761 соответсвует белок M0TM94, Query_165763 - A0A087GZ82

Рис.2


На данной карте видно, что произошла дупликация наиболее длинного участка(полученные участки отмечены голубым и оранжевым цветом)А также была транслокация ( участки выделенные желтым и оранжевыми цветами).Гомологичные участки на схеме представлены в виде диагоналей. Коричневым цветом выделены места, где произошла делеция.
Схематично, это можно представить в виде однобуквенного кода:
M0TM94 ABCDE
A0A087GZ82 BCDEABCDE
Примечание: A-небольшой участок, окрашен желтым цветом. BCDE-длинные участки(голубой и оранжевый)